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Procede de production d'une proteine recombinante d'interet et proteine 

produite. 

Uinvention a pour objet un nouveau procede de production de proteine 
d'interet, en grande quantite, directement utilisable pour des analyses 
structurales. Uinvention concerne 6galernent la proteine recombinante obtenue. 

Les r§cepteurs couples aux proteines G (RCPGs) constituent une super- 
fannille de proteines membranaires caracteris6es par 7 domaines 
transmembranaires (TM I a VII) qui jouent un role primordial dans la 
communication intercellulaire et la reception des signaux sensoriels [1]. 

Avec plusieurs centaines de membres identifies, les RCPGs constituent la 
famille structurale et fonctionnelle de recepteurs membranaires la plus 
importante. lis represented notamment une part significative du genome humain 
connu a ce jour (au moins 700 recepteurs, 0.5 % du genome). 

Exprimes a la surface de toutes les cellules d'un organisme (de la levure a 
I'homme), iis sont actives par une tres grande vari§te de messages 
extracellulaires (peptides, hormones, lipides, molecules odorantes, lumiere, 
nucleotides, nucleosides, molecules du gout, etc.). Leur activation entrame une 
cascade intracellular de signaux par I'intermediaire de proteines G et resulte en 
un grand nombre de reponses cellulaires (par exemple division ou contraction 
cellulaire, neurotransmission). 

De fagon generate, les RCPGs sont impliques dans chaque fonction 
physiologique. Uimportance de ces recepteurs ainsi que la connaissance de leur 
localisation cellulaire les designe comme des cibles ideales de la therapeutique. 
Et effectivement, on peut estimer que pres de 50% des medicaments sur le 
marche agissent via les RCPGs. Beaucoup de pathologies sont la consequence 
de mutations des RCPGs, et leurs manifestations cliniques sont bien connues, 
on peut citer par exemple cecite, diabete insipide n6phrog§nique, hypo- ou 
hyperthyroTdisme, puberte precoce, obesite [2]. 

La decouverte que certains recepteurs des chemokines sont des 
cofacteurs de ['infection par le virus HIV renforce Pidee que les RCPGs sont 
impliques dans une grande variety de situations pathologiques [3]. 
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Ces considerations generates indiquent clairement la necessite d'etudier 
I'architecture fonctionnelle de ces recepteurs, afin de mieux comprendre le 
processus de transduction du signal et la dynamique de leurs interactions avec 
diverses molecules (ligands ou partenaires intracellulars), ainsi que pour 
5 developper de nouveaux outils pharmacologiques et therapeutiques. Cependant, 
I'etude de I'architecture fonctionnelle des RCPGs par les methodes 
experimental « directes » (cristallographie aux rayons X, RMN, spectrometrie 
de masse) reste encore tres limitee. Une seule structure tridimensionnelle (3D) 
est actuellement connue, celle de la rhodopsine de bceuf [4], du fait du tres fort 
10 niveau d'expression naturel de ce recepteur dans la retine. La connaissance de 
leur architecture fonctionnelle est done abordee actuellement par un faisceau de 
methodes theoriques (modelisation), physico-chimiques (photomarquage, 
fluorescence) et biologiques (mutagenese dirigee, pharmacologie moleculaire, 
knock-out, etc.). 

15 Ces etudes represented un enjeu industriel et socio-economique de 

premiere importance, compte tenu des applications therapeutiques potentielles. 

Cependant I'etude structurale et fonctionnelle des RCPGs est tres difficile 
pour diverses raisons : 

- la nature transmembranaire de ces proteines et leur cargctere 
20 hydrophobe rendent leur manipulation delicate et conduisent en general^ une 

perte de la fonctionnalite et a une denaturation apres solubilisation ; 

- les obtenir dans la totalite de leur sequence primaire reste tres difficile. 
La plupart du temps, ils sont exprimes sous forme tronquee [5]. 

- ils sont exprimes en quantite tres faible (0.01% des proteines 
25 membranaires) ce qui constitue un blocage a leur purification en grande 

quantite ; 

- leur poids moleculaire est eleve (superieur a 40 kD), et ils sont 
caracterises par la presence de modifications post-traductionnelles 
(glycosylation, palmitoylation, phosphorylation) et de traits structuraux particuliers 

30 (ponts disulfure) ; 

- ce sont des proteines multifonctionnelles possedant des domaines 
avec des roles differents : liaison des ligands, activation des proteines G, sites 
allosteriques, zones impliquees dans leur regulation / desensibilisation 
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On comprend aisement que I'etape critique qui constitue actuellement un 
r6el blocage est certainement celle de Tobtention des RCPGs en des quantites 
compatibles avec les approches de biologie structurale « directes ». 

Jusqu'a present, aucune strategie de production en grande quantite, 
generalisable a tous les RCPGs, permettant en outre leur purification sous forme 
fonctionnelle d'une maniere simple, n'a ete mise au point Ponctueliement, 
certains recepteurs ont ete produits en quantite elevee (mg/i de culture) [6-8], 
mais les methodes mises en place ne s'appliquent pas a une majorite de 
RCPGs. 

Les RCPGs ne represented dans ce domaine de la production en grande 
quantite d'une proteine qu'un exemple des difficultes que Ton rencontre lorsqu'ii 
s'agit d'obtenir une quantite importante d'une proteine d'interet. La presente 
invention a pour but de fournir un precede de production en grande quantite 
d'une proteine d'interet, particulierement des RCPGs. 

Les inventeurs ont de maniere surprenante, montre que la construction de 
proteines recombinantes, particulierement de proteines membranaires, tres 
particulierement de RCPGs, comprenant au moins un fragment d'une integrine 
alpha et la proteine d'interet, permet d'obtenir des proteines recombinantes 
pouvant etre exprimees en grande quantite. Cette strategie permet en particulier 
d*obtenir une production desdites proteine en grande quantite dans des 
microorganismes, particulierement dans des bacteries. Lorsque les proteines 
recombinantes de invention sont produites dans des bacteries, elle 
s^ccumulent dans les corps d'inclusion du cytoplasme bacterien. II est alors 
necessaire de renaturer les proteines d f interet pour les obtenir sous forme active 
en une quantite compatible avec une analyse directe de leur structure par 
exemple par cristallographie aux rayons X ou par resonance magnetique 
nucleaire (RMN). Le precede de Tinvention peut permettre en outre la production 
de proteines non tronquees, particulierement lorsqu'il est applique aux RCPGs. 

Les integrines forment une famille de recepteurs lies structurellement et 
fonctionnellement qui participent aux interactions cellule-cellule et cellule-matrice 
extra-cellulaire. Toutes les integrines se presentent sous forme d'heterodimeres 
de sous-unites alpha et beta, liees de maniere non covalente. Sur la base de leur 
sequence primaire, toutes les integrines alpha presentent une region N-terminale 
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constitute de sept sequences en acides amines repetees (repetition I a VII), 
chacune comprenant approximativement 60 acides amines. Certaines sous- 
unites alpha incluent un domaine d'insertion (domaine-l) d'environ 200 acides 
amines, situe entre les repetitions II et III. Les homologies entre les repetitions I 
5 et VII comprennent essentiellement des sequences consensus FG et GAP, 
correspondant aux enchaTnements phenylalanine, glycyl-glycyl, alanyl, prolyl, 
d'ou leur denomination « repetition FG-GAP ». 

A la connaissance des inventeurs, la sous-unite alpha des integrines (par 
ailleurs appelee integrine alpha (integrine a) dans le texte) n'a jamais ete utilisee 

10 dans la construction de proteines recombinantes. 

Ainsi, Tinvention a pour objet premier I'utilisation d'au moins un fragment 
d'une integrine alpha dans la construction d'une proteine recombinante d'interet. 
L'invention a aussi pour objet I'utilisation d'au moins un fragment d'une integrine 
alpha pour la production d'une proteine recombinante d'interet 

15 Par fragment d'une integrine alpha, on entend aussi bien la sequence en 

acide amine complete de I'integrine alpha utilisee qu'une sequence partielle. La 
sequence de I'integrine alpha utilisee peut etre native ou mutee. 
Preferentiellement selon l'invention, la sequence utilisee est une sequence 
comprenant I'extremite N-terminale de I'integrine alpha utilisee, encore*- plus 

20 preferentiellement une sequence correspondant a I'extremite N-terminale de 
I'integrine alpha utilisee. 

Selon un mode particulier de l'invention, le fragment de I'integrine alpha 
utilisee comprend au moins les modules FG-GAP IV a VII et une portion du 
module FG-GAP III de I'integrine alpha utilisee. 

25 Le fragment de I'integrine alpha utilisee peut etre un fragment de toute 

integrine alpha connue. On citera particulierement les integrines a1, a2, a3, a4, 
a5, a6, a7, a8, a9, a10, a1 1, aD, aE, aL, aM, aX, allb ou encore aV. 

Selon un mode de realisation particulier de l'invention, on utilise un 
fragment de 287 acides amines, correspondant a la partie de Textremite 

3 0 N-terminale de I'integrine alpha 5 qui s'etend entre les positions 231 et 51 7, selon 
la numeration tenant compte de la presence du peptide signal. Si Ton ne tient 
pas compte du peptide signal, le fragment utilisable dans l'invention s'etend des 
positions 190 (residu G) a 476 (residu G) de I'integrine alpha5. 
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Lorsque Ton utilise d'autres integrines alpha, les fragments utilisables 
selon Tinvention sont les fragments homologues aux fragments ci-dessus definis. 
Par exemple quand il s'agit de Tintegrine aV, le fragment utilisable selon 
Tinvention correspond a la partie de Textremite N-terminale de Tintegrine aV qui 
s'etend des positions 211 (residu G) a 495 (residu G) selon la numerotation 
tenant compte de la presence du peptide signal. Si Ton ne tient pas compte du 
peptide signal, le fragment utilisable dans 1'invention s'etend des positions 181 
(residu G) a 465 (residu G) de Tintegrine aV. Quand il s'agit de Tintegrine allb, le 
fragment utilisable selon Tinvention correspond a la partie de Textremite N- 
terminale de Tintegrine allb qui s'etend des positions 224 (residu G) a 508 
(residu Q), selon la num§rotation tenant compte de la presence du peptide 
signal. Si Ton ne tient pas compte du peptide signal, le fragment utilisable dans 
Tinvention s'etend des positions 193 (residu G) a 477 (residu Q) de Tintegrine 
allb. 

Selon un mode particulier de Tinvention, le fragment de Tintegrine alpha 
utilisee comprend au moins une sequence en acides amines choisie parmi les 
sequences SEQ ID n°1 (fragment de Tintegrine a5 humaine), SEQ ID n°2 
(fragment de Tintegrine V humaine) et SEQ ID N°3 (fragment de Tintegrine allb 
humaine), de la liste de sequence fournie en annexe. 

Selon un autre mode particulier de Tinvention, le fragment de Tintegrine 
alpha utilise comprend au moins une sequence en acides amines codee par 
Tune des sequences en nucleotides, choisie parmi les sequences SEQ ID N°4 
(fragment de Tintegrine a5 humaine), SEQ ID N°5 (fragment de Tintegrine 
V humaine) et SEQ ID N°6 (fragment de Tintegrine allb humaine), de la liste de 
sequence fournie en annexe. 

Preferentiellement selon Tinvention, le fragment d'integrine alpha est situe 
dans la proteine recombinante d'interet preparee selon Tinvention, en amont de 
la sequence de la proteine d'interet que Ton vise a produire, c'est-&-dire du cote 
N-terminal de la proteine recombinante d'interet que Ton cherche a construire 
et/ou a produire. 

L'invention a egalement pour objet une proteine recombinante 
caracterisee en ce qu'elle comprend, fusionn^s, au moins un fragment d'une 
integrine alpha tel que defini precedemment et une proteine d'interet 
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La proteine d'interet, partie de la proline recombinante de I'invention, 
peut etre toute proteine que Ton cherche a produire, particulierement une 
proteine membranaire, tres particulierement un recepteur couple aux prolines G 
(RCPGs). A titre d'exemple pour ces derniers, on peut citer les recepteurs de la 
5 vasopressine et de I'ocytocine (Via, V2, OTR), les recepteurs des leucotrienes 
(BLT1 , BLT2, CysLTI, CysLT2), les recepteurs adrenergiques (beta 3), les 
recepteurs canabinoTdes (CB1). 

La proteine recombinante de I'invention peut en outre comprendre toute 
sequence en acides amines qui permet de la purifier de mantere aisee. Ainsi 

10 selon un mode particulier de I'invention, la proteine recombinante une sequence 
de 6 residus histidine (tag 6xHIS). Ce tag 6xHIS est incorpore dans la sequence 
de la proteine en vue de sa purification sur colonne de Ni-NTA (Nickel- 
nitrilotriacetic acid) agarose. Preferentiellement, cette sequence est a I'extremite 
C-terminale de la proteine recombinante de I'invention. 

15 De manfere avantageuse, la sequence codant pour les derniers residus de 

I'integrine est mutee pour constituer un site de clivage pour une endoprotease 
(facteur Xa, thrombine), qui permettra apres expression et purification de la 
proteine recombinante, de separer la proteine d'interet de son partenaire de 
fusion. Selon une forme de realisation particuliere de I'invention, le residu L 

20 (position 285) peut etre modifie par mutation en un residu I, les residus E et G 
(positions 286 et 287) etant conserves. Un residu R supplemental peut etre 
introduit par mutagenese. L'enchaTnement ainsi constitue (IEGR) correspond au 
site de clivage par le facteur Xa qui coupe la proteine apres le r§sidu R. 

Sous une autre forme de realisation, le site de clivage au facteur Xa peut 

25 etre transforme en un site de clivage a la thrombine. Pour cela les residus I, E, et 
G peuvent etre remplaces par des residus L, V et P. Le residu R est conserve 
afin d'obtenir I'enchaTnement LVPR. Comme le fragment intSgrine a ete incorpore 
dans le vecteur c6te 3' par un site BamH1 (sequence ggatcc), on obtient done la 
sequence ggatcc codant pour deux residus G et S juste apres LVPR. 

30 L'enchaTnement LVPRGS constitue le.site de clivage a la thrombine, qui coupe la 
proteine apres le residu R. 

On comprend done que dans sa forme la plus elaboree, la proteine 
recombinante de I'invention comprend, de son extremity N-Terminale a son 
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extremite C-Terminale, le fragment d'integrine alpha comportant le site de clivage 
par une endoprotease, la proteine d'interet et le tag 6xHIS. 

Sous une forme particuliere, la proteine recombinante de l'invention 
comprend, de son extremite N-Terminale & son extremite C-Terminale, le 
fragment d'integrine alpha comportant le site de clivage par le facteur Xa, la 
proteine d'interet et le tag 6xHIS. 

Sous une autre forme particuliere, la proteine recombinante de invention 
comprend, de son extremite N-Terminale a son extremite C-Terminale, le 
fragment d'integrine alpha comportant le site de clivage par la thrombine, la 
proteine d'interet et le tag 6xHIS. 

L'invention a encore pour objet I'utilisation d'au moins un fragment d'une 
sequence en nucleotides codant pour au moins un fragment d'une integrine 
alpha tel que defini precedemment, dans la construction d'une sequence en 
nucleotides codant pour une proteine recombinante d'interet telle que definie 
precedemment. 

L'invention a aussi pour objet I'utilisation d'au moins un fragment d'une 
sequence en nucleotides codant pour au moins un fragment d'une integrine 
alpha tel que defini precedemment, pour la production d'une proteine 
recombinante d'interet telle que definie precedemment 

L'invention a en outre pour objet une sequence en nucleotides codant 
pour une proteine recombinante d'interet comprenant au moins un fragment 
d'une sequence en nucleotides codant pour au moins un fragment d'une 
integrine alpha, tel que defini precedemment, et une sequence en nucleotides 
codant pour une proteine d'interet, telle que definie precedemment. 

Preferentiellement, la sequence en nucleotides codant pour au moins un 
fragment d'une integrine alpha utilisable selon l'invention ou comprise dans la 
sequence en nucleotides codant pour une proteine recombinante d'interet selon 
l'invention, peut etre choisie parmi les sequences en nucleotides SEQ ID n°4, 
SEQ ID n°5 et SEQ ID N°6, de la liste de sequence fournie en annexe. 

L'invention a encore pour objet un vecteur comprenant une sequence en 
nucleotides codant pour une proteine recombinante d'interet, telle que definie 
precedemment, comprenant au moins un fragment d'une sequence en 
nucleotides codant pour au moins un fragment d'une integrine alpha et une 
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sequence en nucleotides codant pour une proteine. Le vecteur peut etre un 
vecteur eucaryote tel qu'un plasmide ou un virus. Le vecteur peut aussi etre tout 
vecteur procaryote tel qu'un plasmide ou un phage. 

De preference, le vecteur est un vecteur d'expression, c'est-a-dire capable 
5 de permettre la transcription et la traduction de la sequence en nucleotides qu'il 
contient. 

A titre d'exemple, il est possible de citer les vecteurs de la famiile pET 
vendu par la societe Novagen ou ceux de la famiile pGEX vendus par la societe 
AmershamBiosciences. 
10 L'invention a encore pour objet une cellule dans laquelle une sequence en 

nucleotides codant pour une proteine recombinante d'interet, telle que definie 
precedemment, a ete introduite. Selon un mode particulier de ^invention, la 
sequence a ete introduite sous la forme d'un vecteur tel que defini 
precedemment 

15 Par cellule, on entend ici aussi bien une cellule eucaryote qu'une cellule 

procaryote, particulierement une bacterie. Toute bacterie capable de permettre 
I'expression d'une proteine a partir d'une sequence en nucleotide peut etre 
utilisee selon l'invention. A titre d'exemple, il est possible de citer toutes les 
bacteries qui derivent de BL21, BL21 star, Rosetta, BLR, Origami, .Tuner, 

20 Novablue, toute disponible commercialement 

L'invention a encore pour objet un procede de production d'une proteine 
d'interet, caracterise en ce que dans une premiere etape on introduit dans une 
cellule une sequence en nucleotides codant pour une proteine recombinante 
d'interet, telle que definie precedemment, et que dans une deuxieme etape on 

25 place la cellule dans des conditions suffisantes pour permettre i'expression de la 
proteine recombinante d'interet 

Le procede de Tinvention peut en outre comprendre une etape 
supplementaire au cours de laquelle la proteine recombinante d'interet peut etre 
coupee par action d'une endoprotease, (facteur Xa, thrombine, par exempie), au 

30 site cr6e dans les derniers n&sidus de I'integrine afin de separer la proteine 
d'interet de son partenaire de fusion. 
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Le procede de I'invention peut egalement comprendre une etape 
supplemental au cours de laquelle la proteine recombinante d'interet, ou la 
proteine d'interet separee de son partenaire de fusion, peut etre purifiee. 

Selon le procede de I'invention, la sequence en nucleotides codant pour 
5 une proteine recombinante d'interet peut-etre introduite dans la cellule par toute 
methode connue. A titre d'exemple de methodes utilisables, il est possible de 
citer pour les cellules procaryotes, le choc thermique ou Pelectroporation. Pour 
les cellules eucaryotes, on peut citer I'electroporation, la methode du precipite au 
phosphate de calcium, I'utilisation de polymeres cationiques tels que le DEAE- 
10 dextran ou encore toute methode utilisant des liposomes cationiques ou des 
dendrimeres actives. On peut aussi utiliser des retrovirus pour faire du transfert 
de genes ainsi que les techniques utilisant des microprojectiles pour delivrer de 
I'ADN dans des cellules cibles. 

De meme, toute condition suffisante permettant I'expression de la proteine 
15 recombinante d'interet, connues de I'homme du metier, sont utilisables selon le 
procede de I'invention. 

Enfin, toute methode de purification de la proteine, connue de I'homme du 
metier, peut etre utilisee selon le procede de I'invention. A titre d'exemple, on 
peut citer les methodes de chromatographic d'affinite, de chromatographie 
20 d'echange d'ions, de chromatographie d'interaction hydrophobes ou encore de . 
filtration sur tamis moleculaire. 

Particulidrement, lorsque la proteine recombinante d'interet comprend le 
tag 6xHlS, la purification sur colonne Nickel-acide nitrilotriacetique agarose (Ni- 
NTA) represente une methode de purification particulierement satisfaisante dans 
25 le cadre du procede de I'invention. 

Les techniques utilisables selon I'invention sont connues de I'homme du 
metier. Celui-ci peut se referer aux nombreux manuels disponibles et en 
particulier a "Molecular Cloning, a laboratory manual. 2nd edition, Sambrook, 
Fritsch, Maniatis eds., CSH laboratory press, (1989)". 
30 Outre les dispositions qui precedent, I'invention comprend encore d'autres 

dispositions qui ressortiront de la description qui va suivre, qui se refere a des 
exemples de mise en ceuvre de I'invention ainsi qu'aux dessins annexes, dans 
lesquels : 
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La Figure 1 represente une construction correspondant a un vecteur selon 
T invention. 

La Figure 2 represente la production de la proteine de fusion integrine 
a5-recepteur V2 de la vasopressine selon le procede de I'invention (colonne de 
5 gauche : poids moleculaires des proteines de I'echantillon marqueur ; fleche : 
position de la proteine recombinante integrine a5-recepteur V2 de la 
vasopressine, Nl : proteines d'un echantillon non-induit, 2h, 3h et 4h : proteines 
d'un echantillon induit apres 2h, 3h et 4h d'induction). 

La Figure 3 represente la proteine recombinante integrine a5-recepteur V2 
10 de la vasopressine de la figure 2 apres purification et migration sur gel 
d'electrophorese. (colonne de gauche : poids moleculaires des proteines de 
I'echantillon marqueur ; fleche : position de la proteine recombinante integrine 
cc5-recepteur V2 de la vasopressine) 

Les exemples suivants sont illustratifs de I'invention et ne la limitent 
15 aucunement 

Exemple 1 : Construction d'un vecteur permettant I'expression dans les 
bacteries d'une proteine recombinante d'interet : V 

Un ADN complementaire codant pour la proteine d'interet que Ton veut 
exprimer, est positionne, dans le vecteur pET21a (+) (vendu par la societe 

20 Novagen) en phase avec un fragment 'd'ADN complementaire de I'integrine a5, 
par I'utilisation de sites de restriction appropries. Le fragment de I'integrine a.5 est 
delimite par les sites Ndel et BamHI. Le site Ndel a i'avantage d'incorporer un 
codon ATG qui est le codon initiateur de la traduction. Ce codon initiateur code 
pour une methionine (M). Le site Ndel constitue par la sequence CATATG est 

25 done interessant pour sous-cloner un fragment d'ADN puisque la sequence cible 
se trouve directement en phase avec le codon ATG. Celui-ci constitue alors le 
residu 1. En ce qui concerne I'integrine alpha5, I'ATG du site Ndel est positionne 
en amont de sa sequence nucleotidique. Dans ce cas, I'ATG codera pour une M1 
et le G de I'integrine sera le residu 2. Le fragment de 287 residus sera couple a 

30 la methionine 1 et on obtient done un partenaire de fusion de 288 residus : M1- 
G288. 
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Le vecteur fournit directement la sequence codant pour le tag 6xHIS qui 
sera localise a I'extremite C-terminale de la proteine recombinante d'interet. Un 
site EcoRI est localise dans le vecteur du cote de I'extremite N-terminale du site 
tag. Ainsi I'ADN complementaire codant pour la proteine d'interet est insere entre 
5 le site Bam HI marquant I'extremite C-terminale du fragment d'ADN 
complementaire de I'integrine a5 et le site EcoRI situe du cote de I'extremite N- 
terminale du tag 6xHIS. 

La figure 1 montre le schema d'une telle construction. 

10 Exemple 2 : Expression du recepteur V2 humain de la vasopressine : 

Construction du vecteur : 

L'ADN complementaire du recepteur V2 humain de la vasopressine (Cotte 
et al. f J. BIOL. Chem. 273, 29462-29468, 1998), est insere entre les sites BamHI 
et EcoRI du vecteur obtenu a I'exemple 1 . 
15 Etape 1 : Preparation de I'ADN complementaire du recepteur V2 humain 

de la vasopressine : 

Des sites de reconnaissances pour les enzymes de restriction BamHI et 
EcoRI sont ajoutes de part et d'autre de la sequence de I'ADN complementaire 
du recepteur V2 humain de la vasopressine. Cela est realise par la technique de 
20 PCR classique. L'ADN complementaire du recepteur V2 humain de la 
vasopressine est amplifie a partir du vecteur pRK5-V2, (Cotte et al., J. BIOL. 
Chem. 273, 29462-29468, 1998), a I'aide de deux oligonucleotides amorces 
permettant d'inserer les sites de restriction recherches : 

oligo sens (permet Incorporation du site BamHI) : 5' ATG GGT CGC GGA 
2 5 TCC ATG CTC ATG GCG TCC ACC ACT TCC 3' 

oligo antisens (permet I'incorporation du site EcoRI) : 5* CGA CGG AAT 
TCT GCG ATG AAG TGT CCT TGG CCA G 3' . 

La reaction de PCR est realisee dans 50 microlitres d'un melange 
reactionnel comprenant : 
30 - pRK5-V2 20 ng 

- oligo sens 1 00 ng 

- oligo antisens 100 ng 

- Pfu Turbo polymerase (Stratagene) 2.5 U 
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- tampon Pfu 10X (Stratagene) 5 \i\ 

- dNTP 80 uM final pour chacun des 4 
selon les parametres de cycle suivants : 

- denaturation initiale a 95°C pendant 2 minutes puis 

5 - 25 cycles :95°C, 30 secondes puis 55°C, 1 minute, 72°C, 1,5 

minutes puis 

- elongation finale a 72°Cpendant 10 minutes. 

La presence du fragment amplifie (fragment PCR V2 amplifie) est 
contrdlee sur gel agarose 1%. 
10 Etape 2 : Purification du fragment amplifie (fragment PCR V2 amplifie) : 

La zone du gel d'agarose ou Ton visualise le fragment d'ADN amplifie est 
decoupee et I'ADNc est purifie a I'aide du kit de purification Qiaquick gel 
extraction kit (reference Qiagen 28706), en suivant strictement le protocole 
preconise par le fournisseur. 
15 Etape 3 : Coupure du fragment PCR V2 amplifie par les enzymes BamHl 

et EcoRI : 

Cela est realise en une seule etape a I'aide des enzymes vendues par 
New England Biolabs (NEB) par une incubation de 3 heures 3 37°C, dans un 
volume final de 50 microlitres contenant : 
20 - insert V2 (fragment amplifie) 100 a 200 ng 24 \x\ 

- tampon EcoRI 10X NEB 5 

- serum albumine bovine NEB 100X (10 mg/ml) 1 

- EcoRI ( 40 U ) 2 jxl 
-BamHl (40 U) 2 nl 

25 -eau 16 nl 

En fin de reaction, les deux enzymes sont inactivees par chauffage a 
80°C. pendant 20 minutes. 

Le fragment PCR V2 est alors purifie a partir d'un gel d'agarose 1% selon 
le protocole decrit ci-dessus. 
30 Etape 3 : sous-clonage du fragment PCR V2 amplifie dans les sites 

BamHl et EcoRI du vecteur pET21a de I'exemple 1 : 

La ligation est realisee par incubation a temperature ambiante (20-25°C) 
pendant 4 heures dans un milieu comprenant : 
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- fragment PCR V2 BamHI / EcoRI (100 £ 200 ng) 8 \i\ 
~ vecteur pET21a (30 ng) coup6 par BamHI / EcoRI 3 \x\ 

- tampon ligase 1 0X (NEB) 2.5 \i\ 

- T4 DNA ligase (NEB) 2 jxl 

- eau 9 5 jxl. 

Le produit de ligation, proteine de fusion integrine-recepteur V2 humain de 
la vasopressins, est ensuite utilise pour une transformation des bacteries Rosetta 
(DE3) afin de realiser les tests depression du recepteur. 

Introduction du vecteur depression dans une bacterie et expression de la 
proteine d'interet : 

Transformation : 

Le vecteur obtenu precedemment est ensuite introduit dans une bacterie 
de souche Rosetta (DE3) par la technique du choc thermique en suivant le 
protocole de transformation preconis6 par le fournisseur, en ^occurrence 
Novagen. 

20 \i\ de bacteries Rosetta (DE3) reference Novagen 70954-4 et 1 jllI de 
pET21a-integrine/V2 (quelques nanogrammes) sont incub6s sur glace 30 
minutes, puis maintenus a 42°C pendant 30 secondes et de nouveau sur glace 
pendant 2 minutes pour realiser un choc thermique. 

80 \i\ de milieu SOC (voir composition dans Molecular Cloning, a 
laboratory manual 2nd edition, Sambrook, Fritsch, Maniatis eds. CSH laboratory 
press, 1989) sont alors ajoutes, puis I'ensemble est incube a 37°C pendant 1 
heure sous agitation a 300 tours/minutes. 

Le milieu d'incubation est alors etale sur boTtes de p6tri contenant du 
milieu LB agar + ampicilline a 100 microgrammes / ml. Les boTtes sont incubees 
a 37°C 16 heures. Les bacteries d'une colonie sont alors cultivees a 37°C dans 
10 ml de milieu LB contenant 100 ^g/ml d'ampicilline (ou de son analogue la 
carbenicilline), et la suspension cellulaire est agitee a 300 tours/minutes. 

Expression de la proteine : 

Lorsque la densite optique de la culture atteint 0.6 U, Pexpression de la 
proteine recombinante est induite par addition dIPTG 1 mM. 

Des echantillons sont preleves 2, 3 ou 4 heures apres induction. Pour 
cela, 1 ml de suspension bacterienne, a densite optique de 0,6, est preleve dans 
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chaque culture. L'echantillon est centrifuge pendant 2 minutes a 12000 tours par 
minutes. Le surnageant est elimin6 et le culot est resuspendu dans 60 |jJ de 
tampon de lyse (25 mM Tris, PH8.3, 185 mM glycine, 0,1% SDS). 60 de 
tampon de depot au SDS (10% glycerol, 5% 2-mercaptoethanol, 25 mM Tris-HCI, 
pH 6,5, 8% SDS, bleu de bromophenol (quelques grains)) sont alors ajoutes et 
10 (xl de l'echantillon lyse (extraits proteiques totaux) sont alors deposes sur gel 
d'aciylamide/bis-acrylamide 12% - SDS 0.1 %. Apres migration des prolines, 
elles sont colorees au bleu de Coomassie selon les techniques habituelles. 

La Figure 2 represente les resultats obtenus. Les echantiilons induits sont 
compares a des controles non induits (Nl) mais ayant ete cultives pendant un 
temps equivalent. II est evident que la proteine de fusion a5-recepteur V2, qui 
presente un poids moleculaire apparent autour de 65 kDa, constitue une des 
proteines majoritaires de la bacterie, ce qui est une condition requise pour une 
purification du recepteur en quantite compatible avec des analyses de sa 
structure via des approches de cristallographie ou RMN. 

1 ml de culture ainsi realisee a permis d'obtenir environ 3 fxg de recepteur 
de la vasopressine. 

Exemple 3 : Expression d'autres recepteurs : 

Le reisultat obtenu a Texemple 2 a ete reproduit avec la meme efficacite, 
pour d'autres RCPGs, tels que le recepteur {33-adrenergique, les recepteurs 
BLT2, Cys-LT1 et Cys-LT2 des leucotrienes LTB4, LTD4 et LTC4, le recepteur 
cannabinoTde de type 1, le recepteur Via de la vasopressine et le recepteur de 
1'ocytocine. 

Exemple 4 : Purification de la proteine de fusion fragment d'integrine a5- 
recepteur V2 de la vasopressine obtenu a Texemple 2 : 

La methode utilisee est celle decrite par Porath J. et collaborateurs, (Metal 
chelate affinity chromatography, a new approach to protein fractionation. Nature 
258, 598-599, 1975) 

Uexemple expose ici est un essai qui a permis de purifier 3 mg de 
proteine fusion a partird'une culture bacterienne de 100 ml. 

Une colonie isolee sur LB agar + Ampicilline (100 pg / ml) est piqu6e et 
cultivee dans 10 ml de milieu de culture LB + carbenicilline (100 pg / ml). La 
culture est realisee a 37°C, sous agitation a 300 tours par minute. Lorsque la 
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densite optique de la culture atteint 0,6, la culture est arretee et conservee au 
refrigerateur (cet echantillon est appele preculture). Le lendemain, dans un 
Erlenmeyer de 500 ml, 100 ml de milieu de culture LB + carbenicilline (100 |jg / 
ml) sont ensemences avec 2 ml de preculture et laisse 37°C, a 300 tours par 
minute jusqu'a ce que la densite optique de la culture ait atteint 0,6. 0,1 mM 
d'IPTG sont alors ajoutes a la culture afin d ! induire Pexpression de la proteine 
recombinante. La culture est poursuivie environ 3 heures, jusqu'a obtention d'un 
densite optique de 2,4 (facteur de stimulation de 4). 

La culture est alors centrifugee a 4000 tours par minute pendant 5 
minutes. Le surnageant est elimine et le culot peut §tre lyse directement ou 
conserve a -80°C. 

Pour la lyse, le culot est repris par homogeneisation a la pipette dans 6 ml 
de Tris-HCI 20 mM, pH 8,00 + inhibiteurs de proteases (leupeptine 5 pg / ml ; 
benzamidine 10 pg / ml et PMSF 10 pg / ml). Ces trois inhibiteurs de proteases 
seront incorpores a tous les tampons utilises par la suite. 

Les bacteries sont lysees par sonication a Paide d'une microsonde 
conique Branson (duty cycle 50%, output control 5, frequence 1 burst par 
seconde pendant 30 secondes, puis repos 30 secondes ; ce cycle est repete 5 
fois). Le tube est conserve dans la glace pendant la sonication. Le milieu est 
alors centrifuge pendant 30 minutes a 15000 tours par minute a 4°C. Le 
surnageant est conserve pour controle sur gel d'electrophorese. 

Le culot contient la proteine d'interet puisque celle-ci est accumulee en 
corps d'inclusion. 

Le culot est repris par homogeneisation a la pipette dans 5 ml de Tris-HCI 
20 mM, pH 8,00. Les etapes de lyse et de centrifugation sont repetees une fois. 

Les surnageants des centrifugations sont conserves pour controle sur gel 
d'electrophorese. 

Le culot est repris par homogeneisation a la pipette dans 5 ml de Tris-HCI, 
pH 8,00, uree 1M. Un barreau aimante est place dans l f echantiIlon et celui-ci est 
agite doucement pendant 1h30. Le tube est conserve dans la glace pendant 
cette etape qui correspond a un lavage des corps d'inclusion et permet d'eliminer 
des proteines membranaires ou cytoplasmiques associees aux corps d'inclusion 
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mais qui sont considerees comme contaminantes par rapport a la proteine 
recombinante. 

Uensemble est alors centrifuge & 15000 tours par minute pendant 30 
minutes a 4°C. Le surnageant est conserve pour controle sur gel 
d'electrophorese. 

Afin de solubiiiser les corps d'inclusion et done la proteine d'interet, le 
culot est repris par homogeneisation & la pipette dans 5 ml de Tris-HCI 20 mM, 
pH 8,00, uree 6M, SDS 0.2%. 

Un barreau aimante est plac6 dans I'echantillon et celui-ci est agite 
doucement pendant 3 heures, dans la glace. 

La proteine d'interet (la proteine de fusion fragment d'integrine 
a5-recepteur V2 de la vasopressine) est alors completement denaturee. 

Uensemble est alors centrifuge a 15000 tours par minute pendant 30 
minutes a 4°C. Le surnageant contient la proteine d'interet et constitue 
Techantillon qui sera mis en contact avec la resine Ni-NTA (Nickel-nitriloacetic 
acid) afin de purifier la fusion alpha5-V2 par chromatographie d'affinite. 

3 ml de resine Ni-NTA agarose Superfiow (Qiagen, ref 30430) sont 
equilibres dans du Tris-HCI 20 mM, pH 8,00, uree 6M, SDS 0,2%, NaCI 15.0 mM, 
imidazole 5 mM. On rajoute dans Pechantillon contenant la proteine d'interet une 
quantite suffisante de NaCI et d'imidazole pour obtenir une concentration finale 
de 150 mM de NaCI et de 5 mM d'imidazole. L'echantillon et la resine sont mis 
en contact et on laisse incuber a 4°C pendant 16 heures et sous agitation douce. 
Le melange echantillon/resine est depose dans une colonne plastique. On laisse 
Apres la decantation, la fraction "flowthrough" est recuperee a un debit faible, 
pour controle sur gel d'electrophorese. 

La resine est alors lavee avec 3 x 9 ml d'une solution de Tris-HCI 20 mM, 
pH 8,00, uree 6M, SDS 0,2%, NaCI 150 mM, imidazole 20 mM, pour eliminer 
toutes les proteines non retenues de fagon specifique sur les groupements 
Nickel. Les eluats de lavage sont conserves pour controle sur gel 
d'electrophorese. 

La proteine d'interet est aiors detachee de la resine par passage de 3 ml 
d'une solution de Tris-HCI 20 mM pH 8,00, uree 6M, SDS 0,2%, NaCI 150 mM, 
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imidazole 100 mM. Un aliquot de la proteine purifiee est conserve pour controle 
sur gel d'electrophorese. 

10 uJ du milieu contenant la proteine purifiee sont melanges a 10 jjl! de 
tampon de depot au SDS et I'ensemble est depose sur un gel d'electrophorese. 
5 10 d'echantillon purifie contiennent de 5 a 10 ng de proteine soit dans 3 

ml d'eluat, 1 ,5 a 3 mg de proteine recombinante. 

La figure 3 montre la proteine purifiee deposee sur gel d'electrophorese. 
L'echantillon purifie est dialyse contre une solution de Tris-HCI 20 mM, pH 
8,00, uree 6M, NaCI 150 mM pour eliminer le SDS et I'imidazole. Pour cela, 
10 l'echantillon est place dans une cassette de dialyse Pierce (membrane de 
MWCO de 10000) et la dialyse se fait dans un Becher contenant un litre du 
tampon. La dialyse est effectuee a 4°C pendant au moins 24 heures. 

L'echantillon est recupere et la quantite de proteine d'interet obtenue est 
dosee par mesure d'absorption (excitation a 280 nM, absorption entre 235 et 500 
15 nM). En general, on obtient une D.O de 1 a 1.5, ce qui est equivalent & une 
concentration de 0.5 a 1 mg / ml, ce qui est equivalent a une concentration de 
I'ordrede 10 jxM. 

La proteine purifiee et denature (car solubilisee dans I'uree 6M) est 
utilisee pour les essais de renaturation. 
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REVENDICATIONS 

1) Utilisation cTau moins un fragment d'une integrine alpha dans 
la construction d'une proteine recombinante d'interet. 

2) Utilisation d'au moins un fragment d'une integrine alpha pour 
la production d'une proteine recombinante d'interet 

3) Utilisation selon Tune quelconque des revendications 1 ou 2, 
caracterisee en ce que le fragment d'integrine alpha est une sequence en 
acide amine complete de Pintegrine alpha ou une sequence partielle. 

4) Utilisation selon Tune quelconque des revendications 1 a 3, 
caracterisee en ce que le fragment d'integrine alpha est une sequence 
comprenant Pextremite N-terminale de Pintegrine alpha utilisee. 

5) Utilisation selon Tune quelconque des revendications 1 a 4, 
caracterisee en ce que Pintegrine alpha est native ou mutee. 

6) Utilisation selon Tune quelconque des revendications 1 a 5, 
caracterisee en ce que le fragment d'integrine alpha comprend au moins les 
modules FG-GAP IV a VII et une portion du module FG-GAP III de 
Pintegrine alpha utilisee. 

7) Utilisation selon Tune quelconque des revendications 1 a 6, 
caracterisee en ce que le fragment d'integrine alpha provient d'une 
integrine alpha choisie parmi les integrines a1, a2, a3, a4, a5, a6, a7, a8, 
a9, a10, a11, aD, aE, aL, aM, aX, allb, ou encore aV. 

8) Utilisation selon la revendication 7, caracterisee en ce que le 
fragment d'integrine alpha provient d'une integrine alpha choisie parmi les 
integrines a5, aV ou allb. 

9) Utilisation selon la revendication 8 t caracterisee en ce que le 
fragment de Pintegrine alpha 5 s'etend entre les positions 231 et 517 (en 
tenant compte de la presence du peptide signal) ou des positions 190 a 476 
(en ne tenant pas compte de la presence du peptide signal). 

10) Utilisation selon la revendication 8, caracterisee en ce que le 
fragment de Pintegrine aV s'etend entre les positions 211 et 495 (en tenant 
compte de la presence du peptide signal) ou des positions 181 a 465 (en ne 
tenant pas compte de la presence du peptide signal). 
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11) Utilisation selon la revendication 8, caracterisee en ce que le 
fragment de I'integrine allb s'etend entre les positions 224 et 508 (en tenant 
compte de la presence du peptide signal) ou des positions 193 a 477 (en ne 
tenant pas compte de la presence du peptide signal). 

12) Utilisation selon Tune quelconque des revendications 1 a 11, 
caracterisee en ce que le fragment d'integrine alpha comprend au moins 
une sequence en acides amines choisie parmi les sequences SEQ ID n°1, 
SEQ ID n°2 et SEQ ID N°3 de la liste de sequence fournie en annexe. 

13) Utilisation selon Tune quelconque des revendications 1 a 12, 
caracterisee en ce que le fragment d'integrine alpha comprend au moins 
une sequence en acides amines codee par Tune des sequences en 
nucleotides choisie parmi les sequences SEQ ID n°4, SEQ ID n°5 et SEQ 
ID N°6, de la liste de sequence fournie en annexe. 

14) Utilisation selon I'une quelconque des revendications 1 a 13, 
caracterisee en ce que le fragment d'integrine alpha est situe dans la 
proteine recombinante d'interet preparee selon I'invention, en amont de la 
sequence de la proteine d'interet que Ton vise a produire. 

15) Proteine recombinante caracterisee en ce qu'elle comprend 
au moins un fragment d'une integrine alpha tel que decrit dans I'une 
quelconque des revendications 1 a 14 et une proteine d'interet. 

16) Proteine recombinante selon la revendication 15, 
caracterisee en ce que la proteine d'interet est une proteine membranaire. 

17) Proteine recombinante selon I'une quelconque des 
revendications 15 ou 16, caracterisee en ce que la proteine d'interet est un 
recepteur couple aux proteines G. 

18) Proteine recombinante selon la revendication 17, 
caracterisee en ce que le un recepteur couple aux proteines G est choisi 
parmi les recepteurs de la vasopressine et de I'ocytocine (Via, V2, OTR), 
les recepteurs des leucotrienes (BLT1, BLT2, CysLTI, CysLT2), les 
recepteurs adrenergiques (beta 3), les recepteurs canabinoides (CB1). 

19) Proteine recombinante selon I'une quelconque des 
revendications 15 a 18, caracterisee en ce qu'elle comprend une sequence 
de 6 residus histidine (tag 6xHIS). 
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20) Proteine recombinante selon la revendication 19, 
caracterisee en ce que la sequence de 6 residue histidine est a I'extremite 
C-terminale de la proteine. 

21) Utilisation d'au moins un fragment d'une sequence en 
nucleotides codant pour au moins un fragment d'une integrine alpha tel que 
decrit dans Tune quelconque des revendications 1 a 14, dans la 
construction d'une sequence en nucleotides codant pour une proteine 
recombinante d'interet telle que decrite dans Tune quelconque des 
revendications 15 a 20. 

22) Sequence en nucleotides codant pour une proteine 
recombinante d'interet telle que decrite dans I'une quelconque des 
revendications 1 5 a 20. 

23) Vecteur comprenant une sequence en nucleotides telle que 
decrite a la revendication 22. 

24) Cellule dans laquelle une sequence en nucleotides telle que 
decrite a la revendication 22 ou un vecteur tel que decrit a la revendication 
23 a ete introduit. 

25) Procede de production d'une proteine d'interet, caracterise 
en ce que dans une premiere etape on introduit dans une cellule une 
sequence en nucleotides codant pour une proteine recombinante d'interet, 
telle que decrite a la revendication 22, et que dans une deuxieme etape on 
place la cellule dans des conditions permettant I'expression de la proteine 
recombinante d'interet. 

26) Procede selon la revendication 25, caracterise en ce qu'il 
comporte en outre une etape supplementaire au cours de laquelle la 
proteine recombinante d'interet est coupee par action d'une endoprotease. 

27) Procede selon I'une quelconque des revendications 25 ou 
26, caracterise en ce qu'il comporte en outre une etape supplementaire au 
cours de laquelle la proteine recombinante d'interet ou la proteine d'interet 
separee de son partenaire de fusion, est purifiee. 
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SEQUENCE LISTING 



<110> INSERM 
CNRS 



<120> Procede de production d'une proteine recombinante d'interet et protei 
produite. 

<130> 32412 -FR 

<160> 6 

<170> Patentln version 3.1 

<210> 1 

<211> 288 

<212> PRT 

<213> Homo sapiens 

<400> 1 

Met Gly Gin lie Leu ser Ala Thr Gin Glu Gin lie Ala Glu ser Tyr 
1 5 10 15 

Tyr Pro Glu Tyr Leu lie Asn Leu Val Gin Gly Gin Leu Gin Thr Arg 
20 25 30 

Gin Ala Ser Ser lie Tyr Asp Asp Ser Tyr Leu Gly Tyr Ser Val Ala 
35 40 45 

val Gly Glu Phe Ser Gly Asp Asp Thr Glu Asp Phe Val Ala Gly Val 
50 55 60 

Pro Lys Gly Asn Leu Thr Tyr Gly Tyr Val Thr lie Leu Asn Gly Ser 
65 70 75 80 

Asp He Arg Ser Leu Tyr Asn Phe Ser Gly Glu Gin Met Ala Ser Tyr 
85 90 95 

Phe Gly Tyr Ala val Ala Ala Thr Asp val Asn Gly Asp Gly Leu Asp 
100 105 110 

Asp Leu Leu val Gly Ala Pro Leu Leu Met Asp Arg Thr Pro Asp Gly 
115 120 125 

Arg Pro Gin Glu Val Gly Arg val Tyr val Tyr Leu Gin His Pro Ala 
130 135 140 

Gly He Glu Pro Thr pro Thr Leu Thr Leu Thr Gly His Asp Glu Phe 
145 150 155 160 

Gly Arg Phe Gly Ser Ser Leu Thr Pro Leu Gly Asp Leu Asp Gin Asp 
165 170 175 

Gly Tyr Asn Asp val Ala lie Gly Ala Pro Phe Gly Gly Glu Thr Gin 
180 185 190 
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Gin Gly Val Val Phe Val Phe Pro Gly Gly Pro Gly Gly Leu Gly ser 

Lys Pro Ser Gin Val Leu Gin Pro Leu Trp Ala Ala Ser His Thr Pro 
*l u 215 220 

Asp Phe Phe Gly Ser Ala Leu Arg Gly Gly Arg Asp Leu Asp Gly Asn 

230 235 240 

Gly Tyr Pro Asp Leu He val Gly ser Phe Gly val Asp Lys Ala val 
245 250 255 

Val Tyr Arg Gly Arg Pro lie Val ser Ala ser Ala Ser Leu Thr lie 
260 265 270 

Phe Pro Ala Met Phe Asn Pro Glu Glu Arg Ser Cys Ser Leu Glu Gly 
2/5 280 285 

<210> 2 
<211> 286 
<212> PRT 
.<213> Homo sapiens 

<400> 2 

Met Gly Gin Leu lie Ser Asp Gin val Ala Glu lie val ser Lys Tvr 
-L 5 10 15 

Asp Pro Asn Val Tyr ser He Lys Tyr Asn Asn Gin Leu Ala Thr Arg 
10 25 30 

Thr Ala Gin Ala lie Phe Asp Asp ser Tyr Leu Gly Tyr Ser Val Ala 
i> 40 45 

Val Gly Asp Phe Asn Gly Asp Gly lie Asp Asp Phe Val Ser Gly Val 
bU 55 60 

Pro Arg Ala Ala Arg Thr Leu Gly Met Val Tyr lie Tyr Asp Gly Lys 

70 75 80 

Asn Met ser Ser Leu Tyr Asn Phe Thr Gly Glu Gin Met Ala Ala Tvr 
85 90 95 



Phe Gly Phe ser val Ala Ala Thr Asp He Asn Gly Asp Asp Tyr Al 



110 



a 



Asp Val Phe lie Gly Ala Pro Leu Phe Met Asp Arg Gly ser Asp Gly 
lib 120 125 

Lys Leu Gin Glu val Gly Gin val Ser Val ser Leu Gin Arg Ala Ser 
i3U 135 140 
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Gly Asp Phe Gin Thr Thr Lys Leu Asn Gly Phe Glu Val Phe Ala Arg 

150 155 160 

Phe Gly Ser Ala lie Ala Pro Leu Gly Asp Leu Asp Gin Asp Gly Phe 
165 170 175 

Asn Asp He Ala lie Ala Ala Pro Tyr Gly Gly Glu Asp Lys Lys Gly 
180 185 190 

He Val Tyr He Phe Asn Gly Arg ser Thr Gly Leu Asn Ala val Pro 
J- y -> 200 205 

Ser Gin lie Leu Glu Gly Gin Trp Ala Ala Arg Ser Met Pro Pro Ser 
210 215 220 

Phe Gly Tyr Ser Met Lys Gly Ala Thr Asp lie Asp Lys Asn Gly Tyr 
225 230 235 240 

Pro Asp Leu He Val Gly Ala Phe Gly Val Asp Arg Ala He Leu Tyr 
245 250 255 

Arg Ala Arg Pro val lie Thr val Asn Ala Gly Leu Glu val Tyr Pro 
260 265 270 

Ser lie Leu Asn Gin Asp Asn Lys Thr cys Ser Leu Pro Glv 
275 280 285 

<210> 3 

<211> 286 

<212> PRT 

<213> Homo sapiens 

<400> 3 

Met Gly Leu Leu Ala Gin Ala Pro val Ala Asp He Phe Ser Ser Tvr 
A 5 10 15 

Arg Pro Gly lie Leu Leu Trp His val ser ser Gin ser Leu Ser phe 
20 25 30 

Asp ser ser Asn pro Glu Tyr Phe Asp Gly Tyr Trp Gly Tyr ser val 
j-> 40 45 

Ala val Gly Glu Phe Asp Gly Asp Leu Asn Thr Thr Glu Tyr Val val 
50 55 60 

Gly Ala Pro Thr Trp ser Trp Thr Leu Gly Ala Val Glu He Leu Asp 
65 70 75 80 H 

ser Tyr Tyr Gin Arg Leu His Arg Leu Arg Ala Glu Gin Met Ala Ser 
85 90 95 

Tyr Phe Gly His ser val Ala Val Thr Asp val Asn Gly Asp Gly Arg 
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100 105 



110 



His Asp Leu Leu Val Gly Ala Pro Leu Tyr Met Glu ser Arg Ala Asp 

Arg Lys Leu Ala Glu Val Gly Arg val Tyr Leu Phe Leu Gin Pro Arg 

MS d 2,40 

Gly Pro His Ala Leu Gly Ala Pro ser Leu Leu Leu Thr Gly Thr Gin 

u ' 155 160 

Leu Tyr Gly Arg Phe Gly ser Ala He Ala Pro Leu Gly Asp Leu Asp 

Arg Asp Gly Tyr Asn Asp lie Ala Val Ala Ala Pro Tyr Gly Gly Pro 

x " 190 

ser Gly Arg Gly Gin Val Leu Val Phe Leu Gly Gin ser Glu Gly Leu 



205 



Arg ser Arg Pro Ser Gin Val Leu Asp Ser Pro Phe Pro Thr Gly ser 

£±d 220 

Ala Phe Gly Phe Ser Leu Arg Gly Ala Val Asp He Asp Asp Asn Gly 

su 235 240 

Tyr Pro Asp Leu lie Val GlyAla Tyr Gly Ala Asn Gin Val Ala Val 

250 255 

Tyr Arg Ala Gin Pro Val val Lys Ala Ser Val Gin Leu Leu val Gin 

265 270 

Asp ser Leu Asn Pro Ala val Lys ser Cys val Leu Pro Gin 
3 28 0 285 

<210> 4 

<211> 864 

<212> DNA 

<213> Homo sapiens 

<400> 4 

atgggccaga tcctgtctgc cactcaggag cagattgcag aatcttatta ccccgagtac 60 

ctgatcaacc tggttcaggg gcagctgcag actcgccagg ccagttccat ctatgatgac 120 

agctacctag gatactctgt ggctgttggt gaattcagtg gtgatgacac agaagacttt 180 

gttgctggtg tgcccaaagg gaacctcact tacggctatg tcaccatcct taatggctca 240 

gacattcgat ccctctacaa cttctcaggg gaacagatgg cctcctactt tggctatgca 300 

gtggccgcca cagacgtcaa tggggacggg ctggatgact tgctggtggg ggcacccctg 360 

ctcatggatc ggacccctga cgggcggcct caggaggtgg gcagggtcta cgtctacctg 420 

cagcacccag ccggcataga gcccacgccc acccttaccc tcactggcca tgatgagttt 480 
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ggccgatttg gcagctcctt gacccccctg ggggacctgg accaggatgg ctacaatgat 540 

gtggccatcg gggctccctt tggtggggag acccagcagg gagtagtgtt tgtatttcct 600 

gggggcccag gagggctggg ctctaagcct tcccaggttc tgcagcccct gtgggcagcc 660 

agccacaccc cagacttctt tggctctgcc cttcgaggag gccgagacct ggatggcaat 720 

ggatatcctg atctgattgt ggggtccttt ggtgtggaca aggctgtggt atacaggggc 780 
cgccccatcg tgtccgctag tgcctccctc accatcttcc ccgccatgtt caacccagag 



840 

gagcggagct gcagcttaga gggg g54 

<210> 5 

<211> 858 

<212> DNA 

<213> Homo sapiens 

<400> 5 

atgggtcagc ttatttcgga tcaagtggca gaaatcgtat ctaaatacga ccccaatgtt 60 

tacagcatca agtataataa ccaattagca actcggactg cacaagctat ttttgatgac 120 

agctatttgg gttattctgt ggctgtcgga gatttcaatg gtgatggcat agatgacttt 180 

gtttcaggag ttccaagagc agcaaggact ttgggaatgg tttatattta tgatgggaag 240 

aacatgtcct ccttatacaa ttttactggc gagcagatgg ctgcatattt cggattttct 300 

gtagctgcca ctgacattaa tggagatgat tatgcagatg tgtttattgg agcacctctc 360 

ttcatggatc gtggctctga tggcaaactc caagaggtgg ggcaggtctc agtgtctcta 420 

cagagagctt caggagactt ccagacgaca aagctgaatg gatttgaggt ctttgcacgg 480 

tttggcagtg ccatagctcc tttgggagat ctggaccagg atggtttcaa tgatattgca 540 

attgctgctc catatggggg tgaagataaa aaaggaattg tttatatctt caatggaaga 600 

tcaacaggct tgaacgcagt cccatctcaa atccttgaag ggcagtgggc tgctcgaagc 660 

atgccaccaa gctttggcta ttcaatgaaa ggagccacag atatagacaa aaatggatat 720 

ccagacttaa ttgtaggagc ttttggtgta gatcgagcta tcttatacag ggccagacca 780 

gttatcactg taaatgctgg tcttgaagtg taccctagca ttttaaatca agacaataaa 840 

acctgctcac tgcctgga g5g 

<210> 6 

<211> 858 

<212> DNA 

<213> Homo sapiens 

<400> 6 

atgggtctcc tggcccaggc tccagttgcg gatattttct cgagttaccg cccaggcatc 60 

cttttgtggc acgtgtcctc ccagagcctc tcctttgact ccagcaaccc agagtacttc 120 

gacggctact gggggtactc ggtggccgtg ggcgagttcg acggggatct caacactaca 180 

gaatatgtcg tcggtgcccc cacttggagc tggaccctgg gagcggtgga aattttggat 240 

tcctactacc agaggctgca tcggctgcgc gcagagcaga tggcgtcgta ttttgggcat 300 
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tcagtggctg tcactgacgt caacggggat gggaggcatg atctgctggt gggcgctcca 
ctgtatatgg agagccgggc agaccgaaaa ctggccgaag tggggcgtgt gtatttgttc 420 
ctgcagccgc gaggccccca cgcgctgggt gcccccagcc tcctgctgac tggcacacag 480 
ctctatgggc gattcggctc tgccatcgca cccctgggcg acctcgaccg ggatggctac 540 
aatgacattg cagtggctgc cccctacggg ggtcccagtg gccggggcca agtgctggtg 
ttcctgggtc agagtgaggg gctgaggtca cgtccctccc aggtcctgga cagccccttc 
cccacaggct ctgcctttgg cttctccctt cgaggtgccg tagacatcga tgacaacgga 
tacccagacc tgatcgtggg agcttacggg gccaaccagg tggctgtgta cagagctcag 780 
ccagtggtga aggcctctgt ccagctactg gtgcaagatt cactgaatcc tgctgtgaag 840 
agctgtgtcc tacctcag 



360 
420 
480 
540 
600 
660 
720 
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